在開發程式前也需要了解 AI 基本應用,一起來認識RAG架構是什麼吧!
開始前,你有沒有想過,為什麼有些 AI 機器人會一本正經地胡說八道呢?
我已經在 Day 3 已準備好了所有工具,但如果沒有正確的「建築藍圖」,辛苦打造的機器人,很可能在回答 SDGs 議題時,會給出不正確的答案。這對我的專案目標來說,是致命的缺陷。
今天的挑戰就是要用日常的方式來介紹這個藍圖的核心秘密:一個能讓 AI 擁有「正確知識」的強大架構——> RAG。
在 Day 1和 Day 2,我已經在思考著要如何打造一個能正確推廣 SDGs 知識的機器人。但你可能聽過,傳統的 AI 機器人(LLM)有時會「一本正經的胡說八道 (幻覺 hallucination)」(曲博口吻),也就是憑空捏造事實。
這對我的專案來說是最致命的,因為 SDGs 的推廣需要準確與可靠的資訊。這時候需要給機器人一個強而有力的解決方案。
RAG,全名為 Retrieval-Augmented Generation,中文可以翻譯為「檢索增強生成」。它的概念其實很簡單,就像是給一個聰明的學生一本專門的百科全書,讓他在回答問題前,可以先去查閱正確的資料,而不是憑空想像。
這個架構主要分為兩個核心階段:
1️⃣ 檢索 (Retrieval):當使用者提問時,機器人會先到「外部知識庫」(Day 5將會處理的 PDF 文件)中,快速搜尋與問題最相關的資訊。
2️⃣ 生成 (Generation):機器人接著會將「使用者提問」與「檢索到的相關資訊」一起交給 LLM。LLM 根據這些具體的參考資料來生成回覆,大大降低了「胡說八道」的機率。
那 RAG 架構在機器人專案中,具體是如何運作的呢?
我們可以以使用者的角度來想提問:「第 13 項 SDGs 的氣候行動具體是什麼?」or「氣候行動具體是什麼?」等等有關SDGs的議題。
👉 傳統 LLM:可能會給出一個很籠統、甚至不完全正確的答案。
👉 專案的 RAG 機器人:
1️⃣ 檢索:機器人會將問題轉換為向量,並從我上傳有關SDGs的PDF文件所建立的向量資料庫中,檢索出所有關於「第 13 項 SDGs」與「氣候行動」的相關段落。
2️⃣ 生成:接著,機器人會將這些檢索到的段落與使用者問題,一同傳給 Gemini Flash 模型,並根據這些資料來總結並生成一個精準的回覆。
這樣一來,就能確保機器人提供的資訊是基於我提供的知識,而不是來自網路上的隨機資料。
第四天用簡單說法讓讀者們理解 RAG 這個強大的「建築藍圖」是什麼,而 RAG 功能也將是我的機器人能夠提供準確 SDGs 知識的基石。有了這個概念,明天 Day 5 將正式進入第一個實作任務:處理我的 PDF 知識庫,為 RAG 架構建立第一塊基石。